Des séquences aux tendances

نویسندگان

  • Céline Fiot
  • Florent Masseglia
  • Anne Laurent
  • Maguelonne Teisseire
چکیده

RÉSUMÉ. Les données temporelles peuvent être traitées de nombreuses façons afin d’en extraire des connaissances. La découverte de motifs séquentiels met en évidence des sous-séquences fréquentes contenues dans des séquences d’enregistrements annotés temporellement. L’analyse des accès à un site web permet par exemple de découvrir que “5% des utilisateurs accèdent à la page register.php puis à la page help.html”. Cependant, les motifs séquentiels ne permettent pas d’extraire des tendances temporelles, du type “une augmentation du nombre de requêtes au formulaire d’inscription précède souvent une augmentation des requêtes à la page d’aide quelques secondes plus tard”. Dans cet article, nous proposons d’extraire des motifs caractérisant ces évolutions fréquentes grâce à deux algorithmes, TED et EVA. Nous présentons notre approche, implémentée et testée sur des données réelles.

برای دانلود رایگان متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

Sélection de modèles par des méthodes à noyaux pour la classification de données séquentielles

Ce travail concerne le développement de méthodes de classification discriminantes pour des données séquentielles. Quelques techniques ont été proposées pour étendre aux séquences les méthodes discriminantes, comme les machines à vecteurs supports, par nature plus adaptées aux données en dimension fixe. Elles permettent de classifier des séquences complètes mais pas de réaliser la segmentation, ...

متن کامل

Analyse de séquences d'événements avec TraMineR

Les méthodes de fouille de motifs séquentiels fréquents ont donné lieu, depuis le travail fondateur de Agrawal et Srikant (1995), à un grand nombre de travaux de recherche. La librairie TraMineR pour l’environnement statistique R cherche à rendre ces méthodes accessibles aux chercheurs de divers domaines désirant analyser ou visualiser des ensembles de séquences d’événements. Il est à noter que...

متن کامل

Extraction de Séquences Fréquentes : Des Bases de Données Statiques aux Flots de Données

HAL is a multi-disciplinary open access archive for the deposit and dissemination of scientific research documents, whether they are published or not. The documents may come from teaching and research institutions in France or abroad, or from public or private research centers. L’archive ouverte pluridisciplinaire HAL, est destinée au dépôt et à la diffusion de documents scientifiques de niveau...

متن کامل

Champs de Markov conditionnels pour le traitement de séquences

Résumé. Les modèles conditionnels du type modèles de Markov d’entropie maximale et champs de Markov conditionnels apportent des réponses aux lacunes des modèles de Markov cachés traditionnellement employés pour la classification et la segmentation de séquences. Ces modèles conditionnels ont été essentiellement utilisés jusqu’à présent dans des tâches d’extraction d’information ou d’étiquetage m...

متن کامل

ذخیره در منابع من


  با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

عنوان ژورنال:

دوره   شماره 

صفحات  -

تاریخ انتشار 2008